Skip to main content

知识库

大语言模型的训练数据一般基于公开的数据,且每一次训练需要消耗大量算力,这意味着模型的知识一般不会包含私有领域的知识,同时在公开知识领域存在一定的滞后性。为了解决这一问题,目前通用的方案是采用 RAG(检索增强生成)技术,根据用户提出的问题来匹配最相关的外部数据,将检索到的相关内容召回后作为模型提示词的上下文来重新组织回复。

SenseFlow的知识库功能将 RAG 的各处理步骤可视化,提供了一套简单易用的用户界面来方便应用构建者管理知识库,并能够快速集成至 AI 应用中。你只需准备知识库内的数据,SenseFlow支持以下格式:

  • 长文本内容(TXT、Markdown、PDF、HTML、DOCX、EPUB)
  • 结构化数据(XLSX、XLS、CSV、XML)
  • 演示文档(PPT、PPTX)
  • 邮件数据(EML、MSG)

在SenseFlow中,知识库(Knowledge)是一些文档(Documents)的集合,文档并不局限于某种特定的格式,它是一个泛指的概念,涵盖了所有上传到知识库的数据。作为文档集合的知识库可以被整体集成至一个应用中作为检索上下文使用。